Setelah mempelajari bab ini, Anda diharapkan:
Statistika inferensial adalah cabang statistika yang mempelajari penarikan kesimpulan tentang populasi berdasarkan data dari sampel. Konsep-konsep dasar yang perlu dipahami dalam analisis statistika ini meliputi perbedaan antara populasi dan sampel, teknik pengambilan sampel, distribusi sampel dan distribusi statistik sampel, serta prinsip-prinsip terkait distribusi statistik, yakni beberapa di antaranya adalah teorema limit sentral dan distribusi normal.
Setelah memahami konsep-konsep tersebut, kita dapat melanjutkan pembahasan ke penarikan kesimpulan karakteristik populasi dari hasil sampel, yang mencakup pembuatan estimasi parameter dan pengujian hipotesis yang menyatakan karakteristik seluruh populasi dari hasil sampel.
Populasi adalah seluruh kelompok objek (baik orang, benda, maupun kejadian) yang menjadi target penelitian kita. Ukuran statistik deskriptif dari populasi, seperti rata-rata (\(\mu\)) atau simpangan baku (\(\sigma\)), disebut parameter. Parameter inilah yang sebenarnya ingin diketahui oleh peneliti. Namun, karena jumlah populasi biasanya sangat besar, sering kali kita tidak mungkin mengukur seluruh anggota populasi secara langsung.
Sebaliknya, sampel adalah sebagian kecil dari populasi yang kita ambil untuk diamati. Sampel yang baik harus bisa mewakili sifat keseluruhan populasinya (representatif). Ukuran statistik deskriptif dari sampel inilah yang disebut statistik (seperti rata-rata \(\bar{x}\) atau simpangan baku \(s\)). Nilai statistik ini digunakan untuk menduga nilai parameter populasi.
Mengapa kita mengambil sampel? Alasan utamanya adalah efisiensi dan kelayakan. Menurut @saunders2023, melakukan sensus terhadap populasi yang besar sering kali tidak praktis karena membutuhkan biaya yang sangat mahal dan waktu yang lama. Selain itu, @devaus2014surveys menekankan bahwa sensus tidak menjamin data yang lebih akurat. Sebaliknya, sampel yang dipilih dengan hati-hati memungkinkan peneliti untuk mengontrol kualitas data dengan lebih ketat (misalnya melalui pelatihan pewawancara yang lebih intensif), sehingga justru dapat menghasilkan tingkat akurasi yang lebih tinggi dibandingkan sensus yang rentan terhadap non-sampling error.
Kita ingin menganalisis data karakteristik perjalanan mahasiswa di ITERA. Oleh karena itu, kita mengumpulkan data terstruktur yang mengukur variabel-variabel terkait pola perjalanan mahasiswa di ITERA.
Berdasarkan data tahun 2023 pertengahan, tercatat sebanyak 18.877 mahasiswa aktif di ITERA. Jika kita mengumpulkan seluruh mahasiswa aktif dengan jumlah tersebut, maka kita akan mendapatkan data populasi. Namun, karena jumlah mahasiswa yang sangat banyak, kita tidak mungkin mengumpulkan data seluruh mahasiswa aktif di ITERA. Oleh karena itu, kita mengumpulkan data sebagian mahasiswa aktif di ITERA, yaitu sebanyak 428 mahasiswa.
Ilustrasi Perbandingan Populasi Mahasiswa ITERA dan Sampel
Keputusan mengambil 428 sampel ini didasarkan pada pertimbangan efisiensi dan akurasi yang telah kita bahas sebelumnya. Melakukan sensus terhadap 18.877 mahasiswa tentu membutuhkan biaya dan waktu yang sangat besar. Selain itu, dengan jumlah yang jauh lebih sedikit, peneliti dapat lebih fokus menjamin kualitas data (misalnya meminimalisir kesalahan input atau bias wawancara), sehingga data sampel ini diharapkan memiliki kualitas yang lebih baik daripada sensus yang dilakukan secara terburu-buru.
Teknik pengambilan sampel bertujuan memastikan bahwa sampel yang dipilih benar-benar dapat mewakili populasinya. @healey2021statistics menekankan prinsip EPSEM (Equal Probability of Selection Method), yakni prinsip yang menekankan bahwa setiap anggota populasi memiliki kesempatan yang sama untuk dipilih. Hal ini penting untuk menghasilkan sampel yang representatif.
Teknik probabilitas adalah teknik yang menggunakan prinsip EPSEM. Untuk dapat menggunakannya, kita harus memiliki kerangka sampel. Kerangka sampel adalah daftar seluruh anggota populasi yang akan menjadi acuan kita untuk memilih sampel nantinya. Ada empat jenis teknik yang termasuk ke dalam teknik pengambilan sampel probabilitas [@tjokropandojo2021pengantar, @saunders2023]: simple random sampling, systematic sampling, stratified sampling, dan multi-stage cluster sampling.
Untuk mempermudah pemahaman, bayangkan kita memiliki populasi kecil yang terdiri dari 16 orang saja. Setiap orang memiliki atribut Kelompok (A/B/C/D) dan tinggal di Blok tertentu (1/2/3/4).
Berikut adalah data lengkap ke-16 orang tersebut:
| ID | Jarak | Kelompok | Blok | ID | Jarak | Kelompok | Blok |
|---|---|---|---|---|---|---|---|
| 1 | 2.5 | A | Blok 1 | 9 | 10.5 | A | Blok 3 |
| 2 | 1.0 | B | Blok 1 | 10 | 11.2 | B | Blok 3 |
| 3 | 5.2 | C | Blok 1 | 11 | 9.8 | C | Blok 3 |
| 4 | 3.8 | D | Blok 1 | 12 | 8.5 | D | Blok 3 |
| 5 | 0.5 | A | Blok 2 | 13 | 15.0 | A | Blok 4 |
| 6 | 1.2 | B | Blok 2 | 14 | 14.2 | B | Blok 4 |
| 7 | 4.0 | C | Blok 2 | 15 | 16.5 | C | Blok 4 |
| 8 | 6.1 | D | Blok 2 | 16 | 13.8 | D | Blok 4 |
Mari kita terapkan keempat teknik sampling untuk memilih sampel dari 16 orang ini.
Simple random sampling merupakan teknik paling dasar dalam pengambilan sampel probabilistik. Kita mengambil secara acak nomor yang merepresentasikan nomor urut sampel. Ini memungkinkan setiap anggota populasi memiliki peluang yang sama untuk dipilih. Pemilihan anggota sampel secara acak ini dapat dilakukan dengan bantuan sistem eksternal dari peneliti, misalnya melalui tabel angka acak atau program komputer yang menghasilkan angka acak (random number generator) (Gambar @ref(fig:05-inferensia-img-srs)).